#!/bin/sh
# Este script pasa los archivos html bajados de los cuentos a archivos de texto.
cd ~/tesis/cuentos/04-19-download-cuentos/
num=0
#mkdir htmls
#echo "copying html files to directory htmls"
#cp ind*.html* htmls
for name in ind*.*
do
    echo "processing file ${name}"
    mv $name "cuento.${num}.html"
    lynx --dump cuento.${num}.html > "cuento.${num}.txt"
    iconv --from-code=ISO-8859-1 --to-code=UTF-8 cuento.${num}.txt > cuento.${num}.utf-8.txt
    rm cuento.${num}.txt
    let num++
done



